OCR-Software

OCR-Software
OCR-Software,
 
Software, die in der Lage ist, gedruckte Zeichen (Buchstaben, Zahlen, Sonderzeichen) zu erkennen und in digitalen Text umzuwandeln, sodass er, beispielsweise mit einem Textprogramm, weiterbearbeitet werden kann. Die Zeichen werden üblicherweise mit einem Scanner durch Abtasten der unterschiedlichen Helligkeitswerte erfasst und vom Programm unter Ausnutzung von Methoden der Mustererkennung als ANSI-Zeichen ausgegeben (OCR). Voraussetzung dafür, dass ein brauchbares Ergebnis erzielt wird, ist zum einen eine nicht zu schlechte Qualität der Vorlage (u. a. sollte der Kontrast hoch genug sein) und zum anderen, dass das Programm über mehrere Wörterbücher in verschiedenen Sprachen verfügt, die zur Zeichenerkennung herangezogen werden können. Bei bekannter Sprache kann das Programm das komfortable Omnifont-Verfahren anwenden. Die Erkennungsrate (also der Anteil der richtig wiedergegebenen Zeichen am Gesamttext) liegt bei guter OCR-Software zwischen 90 und 95 %. Einige Programme können trainiert werden, d. h., anhand von einigen Probeseiten eines längeren Texts (nur dann lohnt sich der Aufwand) wird dem Programm durch manuelle Korrektur von Fehlern beigebracht, welche Besonderheiten die Buchstabenformen haben. Dadurch lässt sich die Erkennungsrate auf über 95 % steigern. Moderne OCR-Software ist darüber hinaus in der Lage, Layout (z. B. mehrspaltige Texte oder Tabellen und Formulare, ja sogar mathematische Formeln) zu erkennen und zu reproduzieren. Gute OCR-Programme sind beispielsweise OmniPage (von Caere), TextBridge (von Xerox) und FineReader (von Abbyy).

Universal-Lexikon. 2012.

Игры ⚽ Нужно решить контрольную?

Schlagen Sie auch in anderen Wörterbüchern nach:

  • OCR — noun COMPUTING optical character recognition; a computer system for automatically recognizing letters and numbers that have been printed or written by hand on paper: • the scanner s built in OCR software * * * OCR UK US /ˌəʊsiːˈɑːr/ noun [U] IT ► …   Financial and business terms

  • OCR-Schriften — Texterkennung oder auch Optische Zeichenerkennung (Abkürzung OCR von englisch Optical Character Recognition, selten auch: OZE) ist ein Begriff aus dem IT Bereich und beschreibt die automatische Texterkennung von einer gedruckten Vorlage.… …   Deutsch Wikipedia

  • OCR — Computers. 1. optical character reader. 2. optical character recognition. * * * in full optical character recognition Scanning and comparison technique intended to identify printed text or numerical data. It avoids the need to retype already… …   Universalium

  • OCR-A font — OCR A Category Sans serif Designer(s) American Type Founders Commissioned by American National Standards Institute …   Wikipedia

  • OCR-B — Category Sans serif Designer(s) Adrian Frutiger Date released 1968 The OCR B is a set of mono …   Wikipedia

  • OCR Nationals — are vocationally related qualifications which were officially launched by the OCR Board in September 2004. The qualifications are designed to meet the needs of those seeking vocational education in place of the traditional, theory intensive,… …   Wikipedia

  • OCR-B — Schriftart OCR B Kategorie Grotesk …   Deutsch Wikipedia

  • OCR Systems, Inc. — OCR Systems Inc. was a software company based in the Greater Philadelphia area. Founded in 1969 by Dr. Theodor H. Levine, it was a pioneer in optical character recognition. Best known for its ReadRight software, the company was acquired by Adobe… …   Wikipedia

  • OCR — [ˌəu si: ˈa: US ˌou si: ˈa:r] n [U] technical optical character recognition computer software that recognizes numbers and letters of the alphabet which are written on paper, so that information from paper documents can be ↑scanned into a computer …   Dictionary of contemporary English

  • OCR — sigla de optical character recognition (reconocimiento de caracteres ópticos). Técnicas de escaneo y comparación orientadas a identificar texto impreso o datos numéricos. Evitan la necesidad de reescribir material ya impreso para la entrada de… …   Enciclopedia Universal

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”